ZIPFOVY ZÁKONY
Formulace základních vztahů mezi frekvencí jednotky a její distribucí v jazyce. Ačkoli uplatnění Z.z. nemá povahu exaktních kvantitativních zákonitostí (spíše než o zákonu bychom měli mluvit o empirické pravidelnosti), na jejichž základě by bylo možné (bez dodatečných úprav) předvídat hodnoty, které u reálných textů skutečně naměříme, poskytují Z.z. adekvátní deskriptivní rámec pro popis rozložení četnosti v populaci (téměř libovolných) jednotek jaz. Typicky tak Z.z. neplatí pro slova nejfrekventovanější a nejméně frekventovaná. G. K. Zipf formuloval původně 3 vztahy, v praxi se ovšem užívají nejčastěji první dva.
1. Nejpoužívanější Z.z. je možné formalizovat vzorcem: f × r = k, kde f je ↗frekvence slova, r je jeho ↗rank (pořadí) a k je konstanta. Frekvence slova je tedy nepřímo úměrná jeho ranku. Vztah vychází z předpokladu, že existuje tendence po ustavení rovnováhy mezi počtem slov v jaz. (rozrůzněnost jaz.) a jejich frekvencí (jaz. ekonomie). Důsledkem tohoto vztahu je fakt, že každý text obsahuje velmi malý počet slov frekventovaných a většinu slov málo frekventovaných (viz podíl ↗hapaxů na celkovém počtu ↗typů).
2. Vztah mezi počtem slov se stejnou frekvencí a touto frekvencí vyjádřil Zipf takto: a × f2 = k, kde a je počet slov s frekvencí f a k je konstanta. Čím vyšší frekvenční hladinu zkoumáme, tím méně slov na ní najdeme (přičemž úbytek není lineární).
3. Třetí Z.z. se týká vztahu mezi frekvencí slova a počtem jeho významů: m/√f = k, kde m je počet významů slova o frekvenci f a k je konstanta. Tento vztah se dá nejobtížněji empiricky ověřit, protože parcelace významů je vždy značně subjektivní. Principiálně tento Z.z. vypovídá o tom, že slova s nejvyšší frekvencí bývají často polysémní, zatímco slova z nižších frekvenčních pásem mají často jen jeden význam.
- Baayen, H. R. Word Frequency Distributions, 2001.
- Těšitelová, M. Kvantitativní lingvistika, 1987.
URL: https://www.czechency.org/slovnik/ZIPFOVY ZÁKONY (poslední přístup: 21. 11. 2024)
CzechEncy – Nový encyklopedický slovník češtiny
Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020
Provozuje Centrum zpracování přirozeného jazyka